﻿<!--{inc(header.view.html)}-->

<div class="header">    
  
                       <div class="nav">
	                                 <ul id="nav_list">
                                     <li><a href="index.php?app=gather&act=index" target="mainframe">采集参数列表</a></li>
                                                 <li><a  href="#" class="nav_icon"  target="mainframe">手工添加新规则</a></li>                                     
                                     <li><a href="index.php?app=gather&act=addrulesql" target="mainframe">导入新规则</a></li>
                                     <li><a href="index.php?app=gather&act=edit_title&id={$id}" target="mainframe">修改标题参数</a></li>
                                     <li><a href="index.php?app=gather&act=edit_content&id={$id}" target="mainframe">修改内容参数</a></li>									 

	                                 </ul>
                       </div>
                
</div>



<div id="content">
                   <h1>手工添加新规则</h1>

                  <div>
                                    <div class="tips_show"><img  src="{$web_view_dir}style/images/light.gif" align="absmiddle" /> <b>提示: </b>
                                                                  <span ></span>
                                    </div>


                                 
 



<table width="100%" border="0" cellpadding="3" cellspacing="1" class="table_style" >
  <form name="formse" id="formse" method="post" action="index.php?app=gather&act=addtitlepost&id={$id}" >
    <tr class="head" bgcolor="#FFFFFF"> 
      <td colspan="2">&nbsp;</td>
    </tr>
    <tr bgcolor="#FFFFFF"> 
      <td width="40%">规则名称（可任意）:</td>
      <td width="60%"> 
        <input type="text" name="webname" size="40" value="{$webname}">
      </td>
    </tr>

    <tr bgcolor="#FFFFFF" class="susettr">
      <td width="40%">网站编码选择:</td>
      <td width="60%">
        <input type="radio" name="charset_type" value="0" {$charset_typedb[0]} >
        gbk-&gt;gbk 
        <input type="radio" name="charset_type" value="1" {$charset_typedb[1]}>
        utf8-&gt;gbk</td>
    </tr>
    <tr bgcolor="#E7E7E7" align="center"> 
      <td colspan="2"> 
        <input type="radio" name="rulepage" value="0" checked id="rulepage0" onclick="show_rulepage(0)">
        手工输入多页 
        <input type="radio" name="rulepage" value="1" id="rulepage1" onclick="show_rulepage(1)">
        有规则的连续多页</td>
    </tr>
    <tr bgcolor="#FFFFFF" class="morepagenorule"> 
      <td width="40%" bgcolor="#FFFFFF">要采集的标题列表页,有多页,每页换一行<font color="#FF0000"><br>
        <br>
        </font>比较傻瓜化,没规则的标题列表页可以在此输入,而有规则的也可以手工在此一页一页的输入<br><span help=1>注意:是文章的列表页,不是内容页</span>
      </td>
      <td width="60%"> 
        <textarea name="listmoreurl" cols="70" rows="11">{$listmoreurl}</textarea>
      </td>
    </tr>
    <tr bgcolor="#FFFFFF" class="morepagerule"> 
      <td width="40%"> 
        <p>要采集的文章列表网址: (请复制两个不同的列表页网址进行对比,查找变动那个数值即页码用<font color="#FF0000">[page]</font>代替)<font color="#FF0000"><br>
          </font>比如:<br>
          http://qibosoft.com/1/list.php?fid=1&amp;p=<font color="#FF0000">2</font><br>
          http://qibosoft.com/1/list.php?fid=1&amp;p=<font color="#FF0000">3</font><br>
          那右边应该填入<br>
          http://qibosoft.com/1/list.php?fid=1&amp;p=<font color="#FF0000" title="点击即可实现复制" onClick="javascript:CopyText(this);">[page]</font><br>
          对于带有<font color="#FF0000">?</font>号的网址,一般情况第一页不会显示<br>
          http://qibosoft.com/1/list.php?fid=1&amp;p=<font color="#FF0000">1</font> 
          而是<br>
          http://qibosoft.com/1/list.php?fid=1<br>
          所以大家最好从第二页开始分析,第一页有时看不出变化规则 <br>
          <span help=1> 又比如:<br>
          http://qibosoft.com/1/list_<font color="#FF0000">1</font>.htm <br>
          http://qibosoft.com/1/list_<font color="#FF0000">2</font>.htm<br>
          http://qibosoft.com/1/list_<font color="#FF0000">3</font>.htm <br>
          那右边应该填入<br>
          http://qibosoft.com/1/list_<font color="#FF0000" title="点击即可实现复制" onClick="javascript:CopyText(this);">[page]</font>.htm<br>
          注意:如果第一页不是这样<br>
          http://qibosoft.com/1/list_<font color="#FF0000">1</font>.htm <br>
          而是<br>
          http://qibosoft.com/1/index<font color="#FF0000"></font>.htm<br>
          的话,这种情况第一页属于没规则,就需要在下面的表单输入框,输入这一页的网址.这种情况也是比较多出现的</span></p>
        </td>
      <td width="60%"> 
        <input type="text" name="listurl" value="{$listurl}" size="70">
      </td>
    </tr>
    <tr bgcolor="#FFFFFF" class="morepagerule"> 
      <td width="40%">请写出开始页码数值,结尾页页码数值:<font color="#FF0000">(必填)</font><br>
        你可以设置指定采集第几页到第几页.必须要设置一个开始与结尾的页码,一般开始页是1,结尾页的话,就需要你去查看一下被采集的网站的文章列表共有几页,就输入那个数值.<br>
        <span help=1>
		而梯度,一般填1,即如以下格式<br>
        http://qibosoft.com/1/list.php?fid=1&amp;p=<font color="#FF0000">1</font><br>
        http://qibosoft.com/1/list.php?fid=1&amp;p=<font color="#FF0000">2</font><br>
        http://qibosoft.com/1/list.php?fid=1&amp;p=<font color="#FF0000">3</font><br>
        如果填10的话,将如以下格式<br>
        http://qibosoft.com/1/list.php?fid=1&amp;p=<font color="#FF0000">10</font><br>
        http://qibosoft.com/1/list.php?fid=1&amp;p=<font color="#FF0000">20</font><br>
        http://qibosoft.com/1/list.php?fid=1&amp;p=<font color="#FF0000">30</font> 
        <br> </span>
        </td>
      <td width="60%">开始第几页 
        <input name="page_begin" type="text" id="atc_page1" value="{$page_begin}" size="5">
        结束第几页 
        <input name="page_end" type="text" id="atc_page2" value="{$page_end}" size="5">
        <br>
        梯度 
        <input name="page_step" type="text" id="atc_page2" value="{$page_step}" size="5">
        默认1,如果想跳页,你可以写2,3,....</td>
    </tr>
    <tr bgcolor="#FFFFFF" class="morepagerule"> 
      <td width="40%">如果第一页没规则,请单独在此写出来第一页的网址:<br>
        比如第一页不是这个页,即不能访问<br>
        http://qibosoft.com/1/list_<font color="#FF0000">1</font>.htm<br>
        但 <br>
        http://qibosoft.com/1/list.htm<br>
        能访问,此时就在右边输入没规则的第一页</td>
      <td width="60%"> 
        <input type="text" name="firstpage" value="{$firstpage}" size="70">
      </td>
    </tr>
    <tr bgcolor="#FFFFFF"> 
      <td width="40%">自定义正则语法规则(<font color="#0000FF">即用通配符替换原文内容</font>):<br>
        第一步,随意查看一个要采集的标题列表页HTML网页源代码.<br>
        第二步,在源代码里,随意找一篇文章的标题与网址,只能是一篇文章中的一小段代码,不能是两篇.<br>
        举例:比如要采集的某个列表页中的任何一篇文章的标题html代码大致如下<br>
        </td>
      <td width="60%"> 
        <textarea name="title_rule" cols="80" rows="12">{$title_rule}</textarea>
      </td>
    </tr>
    <tr bgcolor="#FFFFFF" class="susettr"> 
      <td width="40%">url链接地址及标题中不能包含的字符<font color="#FF0000"><br>
        </font>一般情况都必填<font color="#FF0000"><b>&lt;<br>
        </b></font>多个请换行<br>
        (目的是过滤太多无用的链接地址) </td>
      <td width="60%"> 
        <textarea name="link_noinclude_word" cols="70" rows="7">{$link_noinclude_word}</textarea>
      </td>
    </tr>
    <tr bgcolor="#FFFFFF" class="susettr"> 
      <td width="40%">标题不能小于几个字符(常用):<br>
        留空不做限制,一个汉字相当于两个字符,一般输入8<br>
        (目的,有效过滤太短的标题也即是无用的链接) </td>
      <td width="60%"> 
        <input type="text" name="title_minleng" size="4" value="{$title_minleng}">
      </td>
    </tr>
    <tr bgcolor="#FFFFFF" class="susettr"> 
      <td width="40%">url链接地址中必须包含的字符<br>
        多个请换行 <br>
        (目的也是过滤太多无用的链接地址) </td>
      <td width="60%"> 
        <textarea name="link_include_word" cols="70" rows="7">{$link_include_word}</textarea>
      </td>
    </tr>
    <tr bgcolor="#E7E7E7" align="center"> 
      <td colspan="2"> 
        <input type="checkbox" name="suset" value="checkbox"  onclick="show_more(0)">
        显示不常用的高级设置(<font color="#0000FF">一般不用</font>)</td>
    </tr>
    <tr bgcolor="#FFFFFF" class="susettr"> 
      <td width="40%">替换标题链接地址中的字符<br>
        (一般留空,目的是有些链接地址比较怪僻,点击默认的不能访问那个内容页,不过情况极少出现.) <br>比如:<br>
		原字符a|新字符a<br>原字符b|新字符b</td>
      <td width="60%"> 
        <textarea name="link_replace_word" cols="70" rows="7">{$link_replace_word}</textarea>
      </td>
    </tr>
    <tr bgcolor="#FFFFFF" class="susettr"> 
      <td width="40%">替换标题中的字符<br>
        (一般留空,目的是过滤某些标题中不想见到的文字) <br>比如:<br>
		原字符a|新字符a<br>原字符b|新字符b</td>
      <td width="60%"> 
        <textarea name="title_replace_word" cols="70" rows="7">{$title_replace_word}</textarea>
      </td>
    </tr>
    <tr bgcolor="#FFFFFF" class="susettr"> 
      <td width="40%">欲截取页面中的指定部分的标题链接地址,此部分标题在整个页面HTML代码所在位置之前唯一出现的字符串<br>
        <br>
        (目的,去除指定标题之前无用信息,更准确无误的采集指定标题链接地址) </td>
      <td width="60%"> 
        <textarea name="list_begin_code" cols="70" rows="7">{$list_begin_code}</textarea>
      </td>
    </tr>
    <tr bgcolor="#FFFFFF" class="susettr"> 
      <td width="40%">欲截取页面中的指定部分的标题链接地址,此部分标题在整个页面HTML代码所在位置之后最先出现的字符串,但不在标题所在html代码里出现过<br>
        <br>
        (目的,去除指定标题之后的无用信息,更准确无误的采集指定标题链接地址) </td>
      <td width="60%"> 
        <textarea name="list_end_code" cols="70" rows="7">{$list_end_code}</textarea>
      </td>
    </tr>
    <tr bgcolor="#FFFFFF" class="susettr"> 
      <td width="40%">开头正则语法程序<br>
        <br>
        <br>
        (适合处理采集比较怪僻的网站.不懂PHP程序的,请留空,否则会出现严重问题使得采集程序无法运行) </td>
      <td width="60%"> 
        <textarea name="list_begin_preg" cols="70" rows="7">{$list_begin_preg}</textarea>
      </td>
    </tr>
    <tr bgcolor="#FFFFFF" class="susettr"> 
      <td width="40%">结尾正则语法程序<br>
        <br>
        (适合处理采集比较怪僻的网站.不懂PHP程序的,请留空,否则会出现严重问题使得采集程序无法运行) </td>
      <td width="60%"> 
        <textarea name="list_end_preg" cols="70" rows="7">{$list_end_preg}</textarea>
      </td>
    </tr>
    <tr bgcolor="#FFFFFF"> 
      <td width="40%"> 
        <input type="hidden" name="testgather">
        <input type="hidden" name="posttime" value="{$timestamp}">
      </td>
      <td width="60%"> 
        <input type="button" name="Submit" value="点击,下一步" onclick="post(0);" class="buton">
        <input type="button" name="Submit2" value="测试采集标题" onclick="post(1);" class="buton">
        (最好先测试,觉得满意后,再提交) </td>
    </tr>
  </form>
</table>
<SCRIPT LANGUAGE="JavaScript">
<!--
function post(va){
	if(va==1){
		document.formse.target="_blank";
	}else{
		document.formse.target="";
	}
	document.formse.testgather.value=va
	document.formse.submit();
}

function show_rulepage(va){
	var s=document.getElementsByTagName("tr");
	for(var i=0;i<s.length;i++){
		if( formse.rulepage1.checked==true ||va==1 ){
			if(s[i].className=='morepagerule'){
				s[i].style.display="";
			}
			if(s[i].className=='morepagenorule'){
				s[i].style.display="none";
			}
			formse.rulepage1.checked=true;
			formse.rulepage0.checked=false;
			document.formse.listmoreurl.disabled=true;	
		}else{
			if(s[i].className=='morepagerule'){
				s[i].style.display="none";
			}
			if(s[i].className=='morepagenorule'){
				s[i].style.display="";
			}
			formse.rulepage1.checked=false;
			formse.rulepage0.checked=true;
			document.formse.listmoreurl.disabled=false;	
		}
	}
}
show_rulepage({$rulepage});
function show_more(va){
	var s=document.getElementsByTagName("tr");
	for(var i=0;i<s.length;i++){
		if( document.formse.suset.checked==true ||va==1 ){
			if(s[i].className=='susettr'){
				s[i].style.display="";
			}	
		}else{
			if(s[i].className=='susettr'){
				s[i].style.display="none";
			}	
		}
	}
}
//位置必须放在最底下
show_more(0);
//-->
</SCRIPT>

<script language="Javascript">
function CopyText(obj) {
	ie = (document.all)? true:false
	if (ie){
		var rng = document.body.createTextRange();
		rng.moveToElementText(obj);
		rng.scrollIntoView();
		rng.select();
		rng.execCommand("Copy");
		rng.collapse(false);
		alert(obj.innerText+'被复制成功');
	}
}
</script>


           
                                 
                                 
                                 
                                 
                                 
                                 
                                 
                                 
                                 

                 </div>

</div>



<!--{inc(footer.view.html)}-->